本文考虑了在动态环境中的异质治疗效果的推断,可协变量和治疗是纵向的。我们专注于样本大小,$ N $的高维病例可能比协变量矢量的维度,$ D $。考虑了边缘结构平均模型。我们提出了一种基于“时刻有针对性”滋扰估计的“顺序模型双重稳健”估计器。这些滋扰估算器经过非标准损耗函数精心设计,从而减少了由潜在的模型误操作造成的偏差。即使发生模型拼写,我们也可以实现$ \ sqrt n $-incerence。我们只需要在每个时间点正确指定一个滋扰模型。这种模型正确性条件比所有现有的工作较弱,甚至含有低维度的文献。
translated by 谷歌翻译
本文提出了在多阶段实验的背景下的异质治疗效应的置信区间结构,以$ N $样品和高维,$ D $,混淆。我们的重点是$ d \ gg n $的情况,但获得的结果也适用于低维病例。我们展示了正则化估计的偏差,在高维变焦空间中不可避免,具有简单的双重稳固分数。通过这种方式,不需要额外的偏差,并且我们获得root $ N $推理结果,同时允许治疗和协变量的多级相互依赖性。记忆财产也没有假设;治疗可能取决于所有先前的治疗作业以及以前的所有多阶段混淆。我们的结果依赖于潜在依赖的某些稀疏假设。我们发现具有动态处理的强大推理所需的新产品率条件。
translated by 谷歌翻译
针对社会福利计划中个人的干预措施的主要问题之一是歧视:个性化治疗可能导致跨年龄,性别或种族等敏感属性的差异。本文解决了公平有效的治疗分配规则的设计问题。我们采用了第一次的非遗憾视角,没有危害:我们选择了帕累托边境中最公平的分配。我们将优化投入到混合构成线性程序公式中,可以使用现成的算法来解决。我们对估计的政策功能的不公平性和在帕累托前沿的不公平保证在一般公平概念下的不公平性范围内得出了遗憾。最后,我们使用教育经济学的应用来说明我们的方法。
translated by 谷歌翻译
本文涉及根N的可行性和手段,始终估算高维,大约稀疏回归的线性,均方连续功能。这些对象包括各种有趣的参数,例如回归系数,平均衍生物和平均治疗效果。我们给出了回归斜率和平均导数的估计量的收敛速率的下限,并发现这些界限大大比低维,半参数设置大。我们还提供了依据的机器学习者,这些学习者在最小的稀疏条件或速率双重鲁棒性下是一致的。这些估计值对在先前已知的更一般条件下保持root-n一致的现有估计值有所改善。
translated by 谷歌翻译
了解特定待遇或政策与许多感兴趣领域有关的影响,从政治经济学,营销到医疗保健。在本文中,我们开发了一种非参数算法,用于在合成控制的背景下检测随着时间的流逝的治疗作用。该方法基于许多算法的反事实预测,而不必假设该算法正确捕获模型。我们介绍了一种推论程序来检测治疗效果,并表明测试程序对于固定,β混合过程渐近有效,而无需对所考虑的一组基础算法施加任何限制。我们讨论了平均治疗效果估计的一致性保证,并为提出的方法提供了遗憾的界限。算法类别可能包括随机森林,套索或任何其他机器学习估计器。数值研究和应用说明了该方法的优势。
translated by 谷歌翻译
This paper presents a corpus annotated for the task of direct-speech extraction in Croatian. The paper focuses on the annotation of the quotation, co-reference resolution, and sentiment annotation in SETimes news corpus in Croatian and on the analysis of its language-specific differences compared to English. From this, a list of the phenomena that require special attention when performing these annotations is derived. The generated corpus with quotation features annotations can be used for multiple tasks in the field of Natural Language Processing.
translated by 谷歌翻译
Nonconvex optimization is central in solving many machine learning problems, in which block-wise structure is commonly encountered. In this work, we propose cyclic block coordinate methods for nonconvex optimization problems with non-asymptotic gradient norm guarantees. Our convergence analysis is based on a gradient Lipschitz condition with respect to a Mahalanobis norm, inspired by a recent progress on cyclic block coordinate methods. In deterministic settings, our convergence guarantee matches the guarantee of (full-gradient) gradient descent, but with the gradient Lipschitz constant being defined w.r.t.~the Mahalanobis norm. In stochastic settings, we use recursive variance reduction to decrease the per-iteration cost and match the arithmetic operation complexity of current optimal stochastic full-gradient methods, with a unified analysis for both finite-sum and infinite-sum cases. We further prove the faster, linear convergence of our methods when a Polyak-{\L}ojasiewicz (P{\L}) condition holds for the objective function. To the best of our knowledge, our work is the first to provide variance-reduced convergence guarantees for a cyclic block coordinate method. Our experimental results demonstrate the efficacy of the proposed variance-reduced cyclic scheme in training deep neural nets.
translated by 谷歌翻译
Media has a substantial impact on the public perception of events. A one-sided or polarizing perspective on any topic is usually described as media bias. One of the ways how bias in news articles can be introduced is by altering word choice. Biased word choices are not always obvious, nor do they exhibit high context-dependency. Hence, detecting bias is often difficult. We propose a Transformer-based deep learning architecture trained via Multi-Task Learning using six bias-related data sets to tackle the media bias detection problem. Our best-performing implementation achieves a macro $F_{1}$ of 0.776, a performance boost of 3\% compared to our baseline, outperforming existing methods. Our results indicate Multi-Task Learning as a promising alternative to improve existing baseline models in identifying slanted reporting.
translated by 谷歌翻译
元梯度方法(Xu等,2018; Zahavy等,2020)为非平稳加强学习问题中的超参数选择和适应性提供了有希望的解决方案。但是,尚未系统地研究此类环境中元梯度的特性。在这项工作中,我们在非平稳环境中对元级别的新清晰度进行了新的清晰度。具体而言,我们问:(i)应向学习的优化者提供多少信息,以使一生中更快地适应和概括,(ii)在此过程中学习了什么元访问功能,以及(iii)是否)元梯度方法在高度非平稳的环境中提供了更大的优势。为了研究提供给元淘汰的信息的影响,如最近的作品(Flennerhag等,2021; Almeida等,2021),我们用学识渊博的元参数功能替换了固定更新规则的调谐元参数选定的上下文功能。上下文功能携带有关代理性能和环境变化的信息,因此可以告知学习的元参数计划。我们发现,添加更多的上下文信息通常是有益的,从而导致元参数值更快地适应并在一生中提高绩效。我们通过对结果的元参数计划和上下文特征的学习功能进行定性分析来支持这些结果。最后,我们发现没有上下文,在高度非平稳的环境中,元梯度并不能比基线提供一致的优势。我们的发现表明,情境化的元梯度可以在非平稳设置中的元梯度中提取高性能方面发挥关键作用。
translated by 谷歌翻译
航空图像访问和数量的最新增加,计算能力的增加以及对应用的兴趣为扩大对象检测和域适应研究的范围打开了大门。航空数据集的大小非常大,数据集的每个帧都包含大量密集和小物体。由于缺乏培训数据,因此对航空影像的深度学习应用是落后的,并且研​​究人员最近转向了从标记的数据集到未标记的数据集以减轻问题的域名适应(DA)。这些因素构成了两个主要挑战:数据集之间的高品种(例如,对象大小,类别分布,对象特征统一性,图像获取,距离,天气条件),以及卫星图像中对象的大小以及随后的最先进的失败 - 用于捕获卫星图像中密集重叠对象的小物体,本地特征和区域建议。在本文中,我们建议解决这些问题的两种解决方案:一个域歧视器,以更好地对齐域之间的本地特征空间;以及一条新型的管道,通过空间金字塔池,跨阶段部分网络,基于热图的区域建议以及通过新颖的图像难度评分来改善对象的定位和识别,从而改善了后端,从而改善了基于整体焦点损失衡量标准的对象定位和识别。在图像难度上。我们提出的模型的表现优于最新方法7.4%。
translated by 谷歌翻译